Algemeines Linear Gemischtes Modell (ALGM)

Das Raschmodell als eine Spezialfall des ALGM

Nicklas Hafiz

2024-08-14

Überblick

  • Generalized Linear Modell (GLM)
  • Linear Mixed Model (LMM)
  • Übertragung auf IRT Kontext

Generalized Linear Model

\[ y = Xb+e \]

\[ E(y) = \mu = g^{-1}(Xb) \]

  • mit \(g\) als Link Funktion

Varianzfunktion auch zeigen?

IRT Modell als GLM

\[ g(\mu) = ln(\frac{\mu}{1-\mu}) = Xb \]

IRT Modell als GLM

  • Logistische Regression: Modellierung der Wahrscheinlichkeit einer korrekten Antwort.
  • Zusammenhang der Variablen linear. Muss dann noch auf die logit-scale gebracht werden (Link Funktion).

LLM

library(tidyverse)

## Daten laden
load(here::here("raw_data", "multilevel_data.rda"))

## Überblick
str(stud_data)
tibble [7,185 × 5] (S3: tbl_df/tbl/data.frame)
 $ school  : chr [1:7185] "1224" "1224" "1224" "1224" ...
 $ minority: Factor w/ 2 levels "No","Yes": 1 1 1 1 1 1 1 1 1 1 ...
 $ sex     : Factor w/ 2 levels "Male","Female": 2 2 1 1 1 1 2 1 2 1 ...
 $ ses     : num [1:7185] -1.528 -0.588 -0.528 -0.668 -0.158 ...
 $ mathach : num [1:7185] 5.88 19.71 20.35 8.78 17.9 ...

Umgang mit genesteten Daten

Option 1: Ignorieren

Option 1: Ignorieren

Generell eher keine gute Idee:

  • Die genestete Struktur kann von Interesse sein!
  • Wir tun so, als ob wir mehr Informationen hätten, als wir letztendlich haben. Das liegt daran, dass Abhängigkeiten zwischen den Daten bestehen. Konsequenz:

Standardfehler werden unterschätzt, unsere Inferenzstatistischen Tests werden eher signifikant.

Option 2: Aggregieren

Option 2: Aggregieren

Option 3: Disaggregiert Analyse mit Gruppen als Prädiktoren

Verstehe noch nicht so ganz, wie das grafisch aussehen würde. https://www.cambridge.org/core/journals/political-science-research-and-methods/article/abs/should-i-use-fixed-or-random-effects/12DFCB222123587A37163F2226E85C67

random effect models reduce bias, but can reduce the variance of estimates of coefficients of interest. some sort of regularization

Wird schnell unübersichtlich, lm z.B. gibt uns viele Infos raus, die uns eigentlich gar nicht interssieren. An sich müsste die Grafik ähnlich aussehen wie im nächsten Beispiel? Die Berechnungen sind aber ein bisscehn anders, v.a. wegen Partial pooling.

Option 3: Disaggregiert Analyse mit Gruppen als Prädiktoren

Option 4: Multilevel-Modell

Notizen

Rein Optisch betrachtet scheint es recht wichtig zu sein, auf welche Schule man geht. Die Abweichung von Mittelwert des GesamtSES hat auch einen Einfluss.

Gleichungen

Level 1 Gleichung

Für jede Gruppe j: \[ y_{ij} = \beta_{0j} + \beta_{1j}x_{ij} + e_{ij} \]

Abbildung

Level-2 Gleichung

\[ \beta_{0j} = \beta_{0}+\zeta_{0j} \]

\[ \beta_{1j} = \beta_1 + \zeta_{1j} \]

Abbildung

Das gemischte Modell

Jetzt müssen wir nur noch einsetzen:

\[ y_{ij} = \beta_{0j} + \beta_{1j}x_{ij} + e_{ij} \] \[ \beta_{0j} = \beta_{0}+\zeta_{0j} \]

\[ \beta_{1j} = \beta_1 + \zeta_{1j} \]

\[ y_{ij} = \beta_{0}+\beta_1x_{ij} + \zeta_{0j} + \zeta_{1j}x_{ij} + e_{ij} \]

Random effects





Fixed effects

Random und Fixed effects

Random Effects

  • Annahme eines zugrundeliegenden Gesamtmittelwerts. Von diesem weichen die Gruppen random ab.
  • Bei Wiederholung würden wir andere Gruppen ziehen.
  • Partial Pooling: Regularisierung der Extremen Werte in Richtung Gruppenmittelwert.

Fixed Effects

  • Hier machen wir diese Annahme einfach nicht.
  • Uns interessieren die tatsächlichen Gruppen, bei Wiederholung würden wird die gleichen ziehen.

Beispiel

Wir untersuchen den Erfolg von Verhaltenstherapie und Psychoanalyse anhand der Rückfallquote nach einem Jahr.
Patientinnen müssen hier nach Therapeutinnen genested werden. Dabei können wir die Therapeutinnen als random effects betrachten, wir haben sie ja schließlich nur als Mittel zum Zweck aus der Population an Therapeutinnen gezogen. Die Behandlungsform (Verhaltenstherapie, Psychoanalyse) ist hingegen ein fixed effect, da wir nur diese beiden Behandlungsformen untersuchen wollen.

Anders würde das Ganze aussehen, wenn uns die Erfolgsquote speziell dieser Therapeut*innen interessieren würde. Dann könnten wir sie ebenfalls als fixed effect im Modell mit aufnehmen.

lme4

library(lme4)

mod1 <- lmer(mathach ~ ses_cent + (1|school), data = illustration_dat) 
summary(mod1)
Linear mixed model fit by REML ['lmerMod']
Formula: mathach ~ ses_cent + (1 | school)
   Data: illustration_dat

REML criterion at convergence: 2091

Scaled residuals: 
     Min       1Q   Median       3Q      Max 
-2.52568 -0.67053 -0.06796  0.74859  2.79564 

Random effects:
 Groups   Name        Variance Std.Dev.
 school   (Intercept)  8.778   2.963   
 Residual             34.699   5.891   
Number of obs: 325, groups:  school, 9

Fixed effects:
            Estimate Std. Error t value
(Intercept)  13.1169     1.0447  12.555
ses_cent      2.6255     0.5285   4.968

Correlation of Fixed Effects:
         (Intr)
ses_cent -0.016

Raschmodell als LMM

Warum das Ganze? Es geht doch eigentlich um IRT?

Raschmodell als Spezialfall von LMM

Dafür müssen wir zwei Dinge beachten: - Link Funktion.
- Entscheidung über Annahme von fixed/random effects von Personen und Items.

Fixed und Random Effects

  • Entwicklung Fragebogen um diesen an verschiedenen Stichproben zu nutzen: Person als random, Items als fixed
  • Entwicklung von Items für einen großen Fragenkatalog: Items ebenfalls als random

Exercise

  • Direkt übertragen auf den IRT-KOntext? Also sagen: Nehmt die Daten aus dem letzten Beispiel und fittet ein LLM Modell.
  • Dann Vergleich mit TAM.

Prädiktoren

  • Beispiel aufgreifen, zeigen, wass man mit diesen Modell noch machen kann.